package ch02_data.charset;

import org.junit.Test;

import java.nio.charset.StandardCharsets;

/**
 * 位、字节、字符、字符集、编码
 * <p>
 * 位：数据存储的最小单位，每个二进制数字0或者1就是1个位；
 * 字节：8个位构成一个字节，即：1 byte (字节)= 8 bit(位)；
 * 字符：本文所指的字符是文字和符号的总称，包括文字、数字、字母、标点符号、图形符号等，a、A、中、+、*、の......均表示一个字符；
 * 字符集：字符集由于包含字符（各种字符的集合）的多少与异同而形成了各种不同的字符集。（ASCII字符集、GB2312字符集、GBK字符集、Big5字符集、GB18030字符集、Unicode字符集等。）
 * 编码：规定每个字符分别用一个字节还是多个字节存储。
 *
 * @author guodd
 * @version 1.0 use jdk 1.8
 */
public class CharsetUse {
    @Test
    public void test01() {
        String s = "中";
        System.out.println(s.getBytes(StandardCharsets.UTF_8).length);
    }
}
